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PRtSENTATION DE LA COLLECTION "K" 



En inaugurant aujourd'hui, aprts vingt ann^es d*existence, una nouvelle collection, la s6rie "K", 
le CIRB veut d^monti«r concrdtement le virage qu*il est en train de reiser au niveau de 5on 
orientation g^ndrale et surtout le d6sir de r^pondre ft la soUicitation quotidienne qu*il rc^oit de notre 
socidti contemporaine pla^ devant de nouv^ux besoins linguistiques. 

La collection "K" wt consacr^e exclusivement aux ouvrages produits dans le cadre du projet 
RELAI (Recherche en linguistique appUqude & Tinformatique), projet finance conjointement par 
rUniversit^ Laval et la compagnie IBM. De plus, cette collection acceptera de publier toute recherche 
qui poursuit les mfimes objectifs que ceu.. du projet RELAI et qui sMntdgre dans ce qu*il est convenu 
de d6nommer aujourd*hui les industries de la langi.2. 

est bon de rappeler les objectifs gdn^raux poursuivis par le projet RELAt 



1) D^irrionpcr un rtecsu national «t intera«tioaal d'infennation et d« doeumenUtion dsns la sacUur da 
Is lincuiatlqiM spi^ut* k I'lnfonnatlqiM; 

3) AnaljrMr «t «v*lu«r mi point de vuo isn«««i«- in k^ei^ d« gcstion, d* technique, de jeux et lea 
didnetieida; 

S) IMvatoppn teMer dee steat^iea (code «t protoeole) d'ti^mtion de logiciela raspectant les 
con train tee lasfagiArea et lea comportemeata eultureb dee uaagara. 

4) Analyaar dana la eont«acto de la eomnnmicatkm «itra rutiliaateur et r«cran, divenei con^ioaantea 
Unguiatiquee du menace en voa d'una «yenturile anaAlioratlon et de la traduiaibiUtA et du compor- 
t«n«it (productirit*) de rutilieateur de llnformatiqiM. 

Les nouveaux objectifs du CIRB intSgrent ceux du projet RELAI. En cffet, le CIRB veut cons- 
truire un domaine pluridisciplinaire dont I'objectif principal est "d'analyser dans un premier temps, les 
particularity inhdrentes aux situations linguistiques pour un territoire donn6, de proposer, dans un 
second temps, une position politique en matidre linguistique enchass6e dans un cadre juridique et de 
ddtenniner enfin, tout» les applications pratiques dans la vie quotidienne des citoyens que ce soit 
pour les fonctions de la langue, de I'^ducation, dans le mondc du travail, de Tadminlstration publique, 
du commerce, des communications". 



Octobre 1987 



Lome LA FORCE 
Directeur du CIRB 
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RiSUMt 



Ce logiciel, appel6 LEMMATISEUR*^, est un outil d'analyse de textes. U permet d'analyser les 
mots dans leur contexte imm^diat, af in de constituer une base de donn^es textuelles enrichie par une 
analyse partiellement automatism. 

LEMMATISEUR permet un travail interactif Ik oil Tintervention humaine est nicessairc. De plus, 
afin d*teonomiser sur les interventions r6p^titives, il comporte un mode d'op6ration automatiqu;. 
Celui-ci utilise Ics donn^ d*analyse accumul6es pr^alablement dans un dictionnaire. 

L*ensemble fonctionne de fa^on conviviale, 6tant commands par une hidrarchie de menus cou- 
vrant toute la gamme des choix, & partir des classes g^ndriles de traitement ju$qu*aux operations 
d^taill^es pour les donnies. Le document present est consacr6, aprfes une introduction qui fail I'apolo- 
gie de Tapproche adopt6e, & la description systimatique de Tutilisation du logiciel. 



* Toitf droito rte«nr<« - UnlvmiM Lvni - 1987. 
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0. INTRODUCTION^ 



0. 1 Un loglclel pcur ranaljrse des corpus textuels 

Le logiciel L£MMATIS£UR a 6t6 ddvelopp^ afin de rdpondre t des besoins croissants d'analyse 
de donn^ textuelles venant du secteur des sciences humaines; et cela k une dpoque oil les con- 
traintes buogetaires mettaient fin & la possibility de d^velopper un systdme particulier pour chaque 
usage, n se voulait un outil gdn^ral pour la constitution de bases de donnas textuelles. 

LEMMATISEUR offre un nombrv de fonctions qui facilitent Tanalyse formelle d'un corpus 
donn6. Ainsi, il cr^ une base de donn^ qui peut £tre enrichie par des categories d'analyse deter- 
mine selon les besoins de Tutili^teur. 

Tous les types d'analyse (linguistique, littdraire, historique, philosophique, juridique, politique, 
etc..) ont potentieUement admissibles, en autant que Tanalyse souhaitee se rapporte ft des mots (ou ft 
des unites semblabl^) dans un corpus de textes. 

En guise d'exemple tr&s general, Tutilisateur peut traiter ses donnees selon les phases suivantes: 

1. Saisir les donnees directement sur clavier ft Taide du logiciel; ou les transmettre par modem 
ou sur disquette; 

2. epurer les donne^, les corriger et effectuer la segmentation du texte en mots; 

3. generer et maintenir 1^ fichiers de la base de donnees: fichier des <K:currences, diction - 
naire et lo'jrs index; 

4. analyser les mots du corpus ft traiter en leur assignant des categories, des formes lemma- 
tiques ou d*autres elements d'information; 

5. tirer des index, concordances et copies des donnees ft partir de la base. 

Le logiciel se veut un outil "b-ansportable" de traitement des corpus textuels. II a ete developpe 
comme logiciel d'applicaticn du progiciel dBASE III, un systdme de gestion de bases de donnees com- 
mercialise par Ashton Tate Inc. L*utilisateur peut faire appel ft toutes les ressources de dBASE III 
dans Peyplcltation des fichiers dans la base qu'il aurait creee. 

L3MMATISEUR a et6 con^u pour fonctionner sur un materiel informatique de grande serie. II 
peut etre implante sur un PC d*IBM ou ses clon«, avec 320 Ko de memoire vive et deux unites de 
disqupttes de 360 Ko, dans le contexte du systeme d'operation PC/DOS 2.0. Cepcndant, pour un rende- 
ment satisfaisant, on recommande un PC/AT avec disque rigide et DOS 3.0 ou ses descendants. 

Les fonctions centrals sont celles de Tanalyse des occurrences textuelles. Les analyses ont pour 
objectifs Tassignation d'un lemme pour I'identification lexicale de chaque mot-forme, d'ou le nom du 
logiciel, ainsi que I'etiquettage des fonctions, gra-nmaticales ou autres, tel qu'illustre par les exemples 
du tableau qui suit 



MOT-FORME 


LEMME 


fiTlQUETTE I 


fcTIQUETTE 2 


vaii 




verbe 


I $in§r ind. 


1 


It 


article 


d^fini 


1 


la 


article 


diflni 


1« 


le 


proDom 


comp. dir. 


burecul 


bureau #1 


nom 


"meuble** 


bureau 


bureau if>2 


itom 


"pi^e" 


buremi 


bureau #9 


nom 


"agence* 




^Le texte de rintroduction eat une adaptation d'un article pani en 19S6: **Le lemmatlseun un outil interactif 
pjur lei donn^ teitlueUes*' dam Languee et UnguintiQue . no, 12, pp 255-268, UnWemit4 Laval, Quebec. 
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Le r^ultat recherche est Tobtention d'une base de donn^ enrichie par les categories d'anclyse. 
Les categories sent d«termin6es par Tutilisateur, et peuvent porter sur tous les niveaux d'analyse 
Unguistique: phoodtique, morphologique, lexical, syntaxique ou s^oiantique. Elles peuvent dgaleraent 
etre d'lm ordre autre que linguistique selon la discipline qui intdresse Tanalyste: littfirature. histoire, 
sciences politiques, droit, philosophie, etc. En autant que les traits pertinents peuve^j* etre attribu6s 
avec uLe certalne r6gularit6 aux 6Wments constitutifs du texte que sont les mots-forn-es, !e lemraati- 
seur pourra faciliter le travail en le rendant partiellement automatioue. Dans tous les ca'. ^assignation 
de lemme ou assignation de fonciion) nous parlerons de lemmatisation. 

LEMMATISATEUR facaire le travail de deux fafons: en rendant automatique !a partie repetitive 
du travail, et en travaillant de fagon interactive avec I'utilisateur i& oil il faut unr. decision humaine. 
En mode interactif, le logiciel affiche & I'ecran, selon certains choix offerts k I'utilisateur, le mot- 
occurrence ft analyser dans son contexte. II affiche egalement les choix d'aralyse qui ont deji ete 
acceptes pour le mot-forme et consignes dans un dictionnaire cumulatif, ou ii en impose un nouveau, 
avant de passer au cas suivant. La succession des cas est choisie parmi ies options suivantes: 

1. une seule c^currence; 

2. toutes les occurrences de tel mot- forme; 

3. toutes les occurrence dans Tordre du texte. 

En mode de traitemeut "differ6', les occurrence sont analysies automatiqaement selor. les choix 
presents dans le dictionnaire. L'utilisateur pent reprendre en mode interactif le residu d'occurrences 
non-identifii«s. Simultanement, le dictionnaire est augmente par Tinclusion de chaque nouvelle identi- 
fication. Ou bien, Tutilisateur pent reprendrs les occurrences reconuues comme ambigCes du fait que 
le mot-forme correspond ft deux identifications possibles dans le dictionnaii«. Lors du traitsment en 
differe Toccurrence re^oit automatiquement Tidentification qui est prio»-itaj»e dans le dictionnaire; il 
reste done ft parcourir les occurrences du mot-forme ambigu af«D de relever les ambigttites. Les cas 'de 
mots-formes non-identifies et de mots-formes ambigus peuvent etre scrut6s separ6ment avec des 
options ft I'interieur du mode interactif. Chaque fois qu'un cas fait I'objet d une decision, ii cesse 
d'etre considere comme ambigu ou non identifie. Avec les options dont il dispose, I'utilisateur peut 
limiter scs interventions aux seuls mots qui I'interessent ainsi qu'ft ceux qui causent probieme. 



0.2 L'analyse automatl(]us vs. Taoalyse Interactive 

Si Ton exclut ce qui depend de I'intervention humaine, LEMMATISATEUR est limite de fa?on 
stricte ft la distinction des mots-formes. Pourtant, certains systemes vont beaucoup plus loin dans 
rautomatisatiot de I'analyse des textes. Ii est possible d'integrer I'analyse morphologique pour recon- 
naJtre les formos declinees. L'analyse syntaxique autoniatique permet de taire appel aux contraintes 
formelles impr sees par la langue ft ce niveau, et ainsi de mieux cerner le contenu. Pourquoi ne pas 
incorporer !c maximum d'automatisation afin de reduire au uiinimum la part de travail humain? Cer- 
tains projets suivent cpfte voie avec succes. 

Pourtant la linguistique automatique n'offre pas la solution totale qui permettrait d'eiiminer le 
recours humain. II suffit de considerer n'importe auel cas d'ambii.Oite homographique, comme le mot 
porte qui peut etre nom ou verbe. Dans un premier temps, I'analyso automatique du contexte immediat 
devrait reduire les ambigflites: por:s est verhv* apris un pronom et nom apres un article. II faut 
cependant regarder plus loin, du fait que la et le peuvent etre pronom ou article. On est done amene 
ft un^ analyse syntaxique qui se doit d'etre complete afin d'eiiminer les cas recalcitrants. 

Les travaux d'inteUigence artificielie nous montrent jusqu'oA il faut {K>u$ser les analyses auto- 
matiques pour rescudre les ambigflites au niveau des mots-formes. Dans la phrase Le soldat ferme la 
porte, TambigOite de porte comme verbe (le soldat "solide" porte une chose) ou nom {I'interpretation 
evidente) resiste ft toute analyse syntaxique. Seul le contexte plus large du discours ou des connais- 
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saa^ extra-linguistiqun permettent de trancher entre 1^ deux sens. une analyse ascendante 
(en |»rtant des mots vers la phrase), \& niveaux infdrieurs restent partiellement en plan en attendant 
rapport des niveaux sup^rieun. Certaines ambigQit^ se relaient ainsi jusqu*au-deli des limites de la 
linguistique, 1& ou Tintelligence artificielle propose de les trailer en faisant intervenir des formali- 
sations des connaissaiices de Tunivers. Autrement dit, & la limite, il faut savoir "de quoi 9a parle" 
avant de savoir "ce que 9a dit". 

La solution automatique totale est done une illusion: la comprehension automatique des textes 
dans sa gin^ralit^ ne fait fm$ partie de Tavenir pr^visible. Par cons^uent, une analyse syntaxique 
complete et univoque est igalement impossible. U reste n^anmoins des approch^ partielles: une ana- 
lyse des multiples possibilit6s, mfime rari^imes, de chaque phrase; une analyse univoque comportant 
des erreurs; ou une analyse limitie & ce qui est sfir. La premidre approche implique une revision 
manuelle compldte; la deuxldme entraine un taux d'emur ind^termind; la demidre off re la possibility 
de r^duire le nombre d*ambigult6s qu'il faut reviser. 

L'analyse syntaxique automatique comix^rte un coQt qu*il faut peser contre ses benefices. Les 
resources physiques et humain^ requis^ sont tell^ que 1^ ch.;rcheurs individuels ou en petite 
6qui|M oe peuvent songer & ddvelopper un systdme valable. Seals les centra av^ une certaine enver- 
gure doivent s'y aventurer. Un corollaire de Tenvergure des syst^m^ est celui de leur inertie. II faut 
prendre la grammaire qui est disponible m6me si elle ne ^nvient pas aux orientations th^oriques du 
chercheur, ou bien il faut ^laborer son propre ensemble de regies. Pour un chercheur dont la syntaxe 
automatique n'est pas la sp^ialiti, cela repr^nte un d^placement inportant de son attention. 

D y a d^ facteurs humains qui freinent Tadoption des solutions fortement infonnatis^es. Le 
chercheur h^te & s*engager dans une voie qu'il ne contrdle pas, ou qu*il craint de ne pas pouvoir 
contrOler. Pour la personne qui ne travaille pas d6j& avec 1^ 0!<dinateurs, il faut ajouter Tappr^hen- 
sion devant ^t incoAnu, surtout s'il s*agit d'un gros ^quipement central avec ses couches multiples de 
logiciels d'exploitation, de personnel et de sa structure bureaucratique. Une solution plus douce, mdme 
si elle implique plus de travail humain, devrait 6tre mieux re^ue. 

LEMMATISEUR se situe clairement parmi les logiciels de traitement assisti par I'ordinateur. II se 
distingue par sa facility d*utilisation. A Tinstar des tendances 4 la conviviality des systdmes en micro- 
informatique, le logiciel fonctionue par menu. L*utilisateur n*a qu'& choisir les fonctions voulues et h 
foumir ses analyses en riponse aux choix affichis sur r6cran. II n*a & maltriser ni le DOS ni le 
langage dBASE III. 

La caract6ristiqu8 la plus notable pour les utilisateurs en sciences humaines, c'est le contrdle 
direct sur r^tat des donn^es que lui confdre Tinteractivity du traitement. L'automatisation des pro- 
cessus peut avoir comme consequence d^savantageuse que Tintdresse ne sait pas s*il y a des erreurs 
dans les risultats, et il ^t impuissant & en faire la verification de fa^on selective. Le mode automa- 
tique de lemmatisation peut tris bien engendrer des identifications erronees, mais le mode interactif 
foumit le moyen de les verifier et de les corriger. Une decision quant & la categorisation d un mot- 
forme n*empeche pas la reprise, au besoin, de chacune des occurrences du mot-forme en fonction de 
son contexte particulier. 

Le contrdle direct des analyses implique un coQt en temps humain. Si Tabsence d'erreur est 
exigee de la part du chercheur, le travail humain devient un in vestissement indispensable. Comme nous 
Tavons vu, la lemmatisation entidrement automatique entraine un taux d*erreurs qui est en general 
indeterminable. 

Si LEMMATISEUR n'eiimine pas compUtement le travail repetitif , il a quand mftme I'avantage 
de le reduire, tout ea le faisant porter le plus pris possible de Fob jet d'interfit du chercheur. Ce 
dernier peut limiter son analyse des occurrences k celles qui presentent un interet possible. Le nom- 
bre de ses interventions est en fonction du nombre d'occurrences qui posent des probiemes d'identifi- 



ERIC 



12 



cation. Et chaque interventioo porte sur un dl^ment des donn6«s da chercheur; non pas sur un code 
arbitraire dans un hmgage de contrOle 6tranger k ses prtoccupatjoii piincipales. Autrement dit, le 
travail du chercheur entralnera une connaissance accrue de ses donndes. 

Par exemple, il serait possible de r^duire le taux d*ambigu!t6 & Taide d*une fonction de recher- 
che MQtextuelle. La distinction entre le pronom et ie article est relativement simple dans un ton 
nombre de cas. Mais pour des mots-fonros moins frequents que ie^ la rentabilitS d*une "disambiguisa- 
tion" automatique s*estompe. La diminution du travail de verification des occurrences en contexte 
serait contrebalancde par le travail d*eiaboration des regies de d6sambiguisation. 

n ne faut pas perdre de vue que le travail d*analyse contextuelle du langage a Tavantage d'etre 
naturel et facile pour les humains, contrairement au travail d*informatisation d^ proc6d6s d'analyse. 
D suffit de penser ft la facility avec laquelle nous regions des cas conune Le soldat ferme la porte 
chaque fois qt^ quelqu'wt Vmtvre. Nous, etres humains, int^grons k notre lecture du texte une analyse 
descendants, allant du sens vers les elements constitutifs. Dans T^tat actuel des choses nous sommes 
beau«)up mieux pourvus que ne le sont les systtmes informatiques pour la a}mpr6hension des textes, 
& tel point qu*il faut bien y penser avant de remplacer les a^istants de recherche par un tel s^tdme. 

n ne faut pas comprendre par cette plaidoirie qu*il n*y a pas d*in^r6t ft dSpasser le niveau des 
mots-formes dans le traitement des textes par ordinateurs; au contraire. Tout depend des objectifs de 
la recherche. D*autre part, lorsque 1» objectifs comprennent la reconnaissance d*6I6ments de contenu 
moins formels, il peut 6tre stratdgiquement plus efficace d*anticiper les probl&mes de reconnais^ce 
en f aisant la lemmatisation. Par exemple, fanalyse syntaxique automatique est grandement simplif i^ 
si toutes les ambiguitds lexicales sont relev^ d*a^^ce. En gdndral, lorsquMl s^agit d*analyse de 
textes, si les categories d*analy$e peuvent 6tre associ^es aux mots-formes, une partie seulement du 
travail peut dtre automatisie. II est n^cessaire de faire appel aux pouvoirs d^int^gration des connais- 
sances que possddent les hu«rains. Id^alement, un systdme interactif permet prdcisement cela, en 
utilisant ft bon escient ft la fois les qualites de Thomcie et cellos de ia machine. 




1. PRtSENTATION DE LEMMATISEUR 

Ce chapitre rdun't des sujets qui concernent le logici«l de fa^on globale, ou qui sont pr^limi- 
nairra k son utilisation. 



1.1 La dlffosloB fU LEMMATISEUR 

Le logiciel LEMMATISEUR est la propri6t6 de I'Universitfi Laval. II est disponible sur dcmtnde 
auprte de Miclue! Mepham du D^partement de Ungues et linguistique de TUniversiti Laval. L'Uni ver- 
sitd Laval ainsi que son Centre de traitement de rinfonnation d6cUnent toute responsabilit6 lors de 
rutilisation du logiciel. 



A. L*am611oration progressive des logiciels a pour ef f et de rendre p6rim6 la documentation imprimf^e. 
Afin de palller & cette lacune, la description des operations de LEMMATISEUR (le chapitre 2) 
sera mise & jour lors des modifications de programmation, et la version courante du texte sera 
disponible sur disquette en accompagnement de celle du logiciel. 



1.2 Les coUaboratenrs an d«reloppement de LEMMATISEUR 



Le logiciel LEMMATISEUR a 6ti 61abor6 par le Centre de traitement de rinlormation (CTI) de 
rUniversitd Laval. L*^uipe de realisation du CTI se compose comme suit 



Conrad Bourdon 
Marc Boivin 
Mario Toupin 
Denis Legar6 
Lyne Huot 
Nicole Roy 
Gaetane Simoneau - 



chef de projet 

aimlyste rancepteur 

analyste 

programmeur 

progranuneure 

programmeuie 

programmeure 



Le d6veloppement du logiciel a 6te entrepris avec la collaboration du D6partement de langues et 
linguistique et plus specif iquement dans le cadre du projet RELAI (entente IBM -Laval). L'initiative est 
venue de Michael Mepham, directeur de plusieurs travaux qui ont servi de terrain d'6preuve pour le 
perfectionnement du sj^tdme. Plusieurs assistants de recherche ont contribu6 au processus de retro- 
action en tant qu'utilisateurs du logiciel: 



Jacques Ladouceur 
Danielle Lepage 
Richard B^rube 
Mario Plamondon 
Ruth Vander Stelt 
Beckey Jenkins 



Dans ce contexte, le rdle de Jacques Ladouceur mdrite une mention speciale. 

II convient de signaler un projet de la Faculte de theologie qui a egalement servi de termla 
d*6preuve au logiciel. Pierre Cherix et Rdgine Charron, chercheur et chercheure au projet Nag 
Hanunadi, ont exer^ un rdle analogue k celui des utilisateurs du Departement de langues et linguis- 
tique. 
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13 Le coatexte materiel 

LEMMATISEUR fonctioone dans le contexte materiel suivant: 

■ une unit6 centrale avec microprocesseur 1 6 bits, du type PC/XT/ AT d'IBM ou compatible; 

■ un clavier; 

■ un nK>nitettr; 

■ une mAmoire vive (RAM) de 320 Ko ou plus (LEMMATISEUR en venion compil6e occupe 
220 Ko); 

■ unc imprimante graphique facultative; le code ASCII est 6tendu d 256 caractftres selon le 
mode IBM; 

■ une mdnsoire p^riph^rique minimale de deux unit6s de disquettes de 360 Ko; de pr6f6rence: 
disquettes de 1.2 Mo ou disques rigides; 

■ uni^ de cartouche (bande magndtique) facultative. 



1.4 Les toglcfels 

Tel que diffuse, LEMMATISEUR est log6 sur deux disquettes de 360 Ko. L'une des disquettes 
contient les programmes sous forme compile, ainsi que tous les fichiers requis pour sa mise en 
marche. La deuxidme disquette contient un fichier de documentation de forme "read me", qui pr6sente 
toutes les indications util« du document prteent. 

Fwrni h» nchiers de la disquette principale, un certain nombre sont indispensable au fonction- 
nement de I'une ou I'autre des options du logicicl. ns sont list6s ci-dessous pour fins de verification, 
n faut se garder de les ftliminer en faisant le manage parmi les Hchiers qui auraient 6t6 cr6es et 
emmagasinds sur le mfime support II est prudent de d^finir une route ("path") pour les syst^mes af in 
de ne pas m^langer les fichiers cr6es avec ceux qui sont esscntiels au syst^me. 

Les fichiers indispensable sonc 

COD-GRAM.DBF 

Iha5X-STR.DBF 

EXCL-STR.DBF 

MODI-STR.DBF 

SENS-STR.DBF 

DICrr-STR.DBF 

CONPARAMDBF 

IND-STR.DBF 

DICT-TEM.DBF 

Le programme principal 6tant compile, il n'est pas nteessaire de possMer le progiciel dBA^E III. 
Cependant, ce dernier donne beaucoup de possibilit6s de manipulation des fichiers cr66s par LEMMA- 
TISEUR. 

L^utilisateur doit foumir son propre systfeme d'exploitation (DOS). Afin de faciliter I'accfes a 
LEMMATISEUR, il peut constituer une disquette de travail en faisant formater une disquette en 
disquette systdme (voir le manuel du DOS), et en faisant un double du logiciel sur cette demiere. II 
est prudent de garder la disquette initiate en lieu sflr, et de se servir de la disquette de travail. 




1.5 Le lancement du syst^me 

L*utilisateur doit foumir une commande de d^marrage comportant deux pan. idtres afin de 
specifier la localisation du dictionnaire et du fichier des mots exclus. Cette commande qui peut etre 
int^gr^ ft un fichier k commande directe (fichier avec I'extension .BAT) prend la forme suivante: 

♦ 
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[d:>Lemnie [d:] nom du dictionnaire [d:] nom du fichicr des exclusions 



Ex: A>Vmm* B:Oict-l«m AiExdu 



N.B. le nom d*un fichier ne pent excMer 30 caractferes. Si Tun ou Tautre des deux noms de 
fichier n'est pas fourni, le systdme les sollicitera par voie de menu. 

En r6ponse k la commande de ddmamge, LEMMATBEUR af f iche son logo & I'icran et attend le 
signal de Tutilisateur avant de pr^enter le premier d'une s^rie de me^us. 



1.6 Vug d*ensemble des operations 

LEMMATBEUR est command^ par menus successifs. 11 suf f it de choisir les options d6sir6es. En 
guise d'exemple, voici le menu g£n6ral selon sa presentation i T^ran: 



•••• LEMMATBEUR nMnu gto«nl 
(Ol) TraitenMot prtiifflinaire du eorpua 

(03) G&^nt^ st maintioi da la baoqu* d« doanim 
(OS) Lomnwriaation du eocptu 

(04) PHMotatioD d« rteultata 

£at««r U nvmtro &>m^>oxtdtait & rotre choix: 

(Quittw: PgDn ou RETOUR) 



Chaque option m6ne & un autre menu de choix plus ddtaill^ conduisant & I'appUcation d'une des 
fonctions. Nous verrons au chapitre suivant la description de chacune d'entre elles. Pour cette 6tape- 
ci, nous faisons un survol de Tense ble des operations possibles. Les groupes de choix ci-dessous cor- 
respondent aux quatre options du menu general. 



Croupe 01: Traitement priliminaire du corpus 

1: Editeur de texte pour la saisie du corpus au clavier; 
2: Segmentation du corpus en mots-formes; 
3: Transfert d'un corpus sur disque rigide. 



Croupe 02: Cin^ration et maintien de la banque de dcnnies 

Generation d*une banque de donnees et de ses index; 
Correction du corpus; 
Correction du dictionnaire; 
Mise & jour du fichier d^ mots exclus; 
Mise k jour des mots exclus dans la banque de donnees; 

Mise ft jour de la banque de donnees quant aux corrections ap^ rtees au dictionnaire (ino- 
perant, & venir); 

Mise & jour de la table des categoric grammaticales; 
Mise k jotu- des in4ex de la banque de donnees; 
Mise ft jour des index du dictionnaire; 
Mise ft jour de la banque des mots proteges. 



1: 
2: 
3: 
4: 
5: 
6: 

7: 
8: 
9: 
10: 



ERIC 
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Croupe 03: Lemmatisaiion du corpus 

1: Lemmatisation automatique; 

2: Lemmatisation interactive; 

3: Lenunati^tion compl^mentaire, niveau lexical; 

4: Lemmatisation compl6mentaire, niveau contextuel. 



Croupe 04: Presentation des risultats 

1: Index des mots; 

2: Concordance; 

y. Impression du corpus; 

4: Impression du dictionnaire; 

S: Transfert de la banque sur bande magn6tique; 

6: Transfert de la banque sur disquette(s). 



Enfin, chaque menu indique ia fa9on de sortir du menu courant af in de retoumer au menu 
pr6c^ent Dans le cas present, pour quitter le menu g6n6ral du progiciel et retoumer au DOS, il faut 
toucher PgDn ou RETOUR. 



X / 
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DESCRIFnON DES 0P£RATI0NS 

■ Nous proc^ons selon le cheminement des menus. 



2.1 Trattement prdllmlBalre du corpus 



LEMMATMEUR •••• taenu t^iral 

corpus 

(03) G4n«rMtoti «t maintien d« bsnqus de doan6e» 

(03) Lwnm«ttwtten du cMpu* 

(04) PrtesntfttkMi do rteultste 

Entrer U ntimtoe emvipoiMUiil & votn cli^ 0 
(Quittw: PgDn ou RETOUR) 



■ Pour activer I'option 01, taper 1; un second menu s'affiche comma suit 



••••LKMMATISEUR TraitemeBt prtliminure «cran Tl 
(01) Editour 

(03) S^mantfttion du coiptu 

(OS) Tniufart d'uo eorptia nir diique iigid« 

Entrar It BumAro eorreapondttnt & yotn choisc _ 
(M«iu i^^cMant: PgDn chi HETQUR) 



■ Ce menu (6cran Tl ) pr^sente trois options. Toujours de la rafime fa^on, entrer le choix. 

■ Pour sonii de ce menu et retoumer au menu g^n^ral, taper PgDn ou RETOUR. 



OPTION 01: tDITEUR (6cran Tl) 
Description 

a) Ce programme est un dditeur de textes pour la saisie d'un corpus au clavier. II est surtout 
utile pour traiter de courts 6chantillons de texte. 

b) n permet la saisie d*une seule ligne da texte & la fois comprise dans un champ de 70 
caracttres po^ibles. 

c) n consacre un champ de huit caract^res & la r^f^rence de chaque ligne. 

d) Ce programme reconnalt trois d^Iimiteurs afin de faciliter la segmentation du texte en 
mots: 
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1: to dfilimiteur d*occurrence est I'espace (code ASCH 032); Ex: La neige tombe. (3 occurrences 
distinctes) 

2: le dilimiteur de wus-occurrence est rastfirisque (•) (code ASOI 042); il provoque la sepa- 
ration des composantes accolies d*ime expression; Ex: poiy^clinique ( polyclmimte ) (2 occur- 
rences) 

3: to dilimiteur de ponctuation est le trait oblique (/) (code ASOI 047); U sert de dfilimiteur 
entre le mot et la ponctuation; Ex: L/'arc/'en/-cieI disparaSt/. (5 occurrences) Sans trait 
oblique, la ponctuation serait assimilto au mot, pour donner deux occurrences comme ceci* 
Ex: dit'il (une occurrence) Ex: aujourd'hui (une occurrence). 

e) Le programme procMe ft la segmentation automatique des occurrences de chacune des lignes 
de texte. 

0 Le programme emmagasine le fichier d'occurrences de mots en format dBase. 



Fonctiormement 

m Choisir I'option 01 de I'icran Tl; r^ran TU s'affiche comme suit 



fiDITEUR •••• «cr»nTll 
Nom da 1» bsnquc 

P^FmrriON pes DfeLIMITEU^ 

D^Umitsur d'occtunne«: 
D4limit<iur de soui-oeeturence:* 
D^Umiteur d« ponctuation: / 



■ Cet 6cran demande de pr6ciser le code de I'unitd de disque suivi du nom de la banque de 
donn^es dans un champ de 30 caractdres; 



Ex: ^ssnm (ou Cxoroml (ou CorDU52S^ (RETOUR) 



■ Ensuite T^cran T12 s'affiche comme suit 



•••• EDITEUR Baiaie <craii TW 
fUfinnte: 



EatTM I'informatiMi 
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■ Cet *cran demande d'entrer un code de r^f^rence (8 caracteres possibles). Ex: Rfifdrencc; 
00000001 (ou /) (RETOUR) 

■ Ensuite entrer une Ugne de texte (70 caractferes possibles). Ex: La Itme disparut sous 
d'ipais nuages. (RETOUR) 

■ Dam respace entr© la rtference et Tendroit oH il faut entrer rinformation, I'^cran pre- 
sence toujours la Hgne prfec^ente avec sa r6f6rence, telles qu'entr6es. 

■ Pour sortir de cette fonction, faire PgDn; ceci ramine I'utilisateur & Tacran Tl. 



OPTION 02: Segmentation du corpus (^cran Tl) 
Description 

a) La fonction de ce programme est de segmenter un corpus de format DOS pour crier un 
fichier segments en format DOS. Elle ne sert pas a trailer les ^chantillons saisis k I'aide 
de TMiteur (option 01). 

Voici les caractdres reconnus par le programme de segmentation comme s6parateurs d'occur- 
rences: 

1. I'fl>pM« bJ«K 

J. let points: <•> <!> <?> <;> <;> 
S. la virgul* <,> 

4. l'»po*te«plM <*> 

5. lem gnillm^ <*> 

6. U trait dWon <-> 

7. lea cxoclMtt <(> <)> 

8. l«a pamtbtecs <(> <)> 
0. ka acMladaa <{> <}> 

b) Les trois points <...> ne sont pas reconnus comme tels; ils sont traitis comme trois signes 
distincts. 

c) A cause de leur inclusion dans la liste des siparateurs d*occurrences, Tapostrophe <'> et le 
trait d*union <-> provoquent la segmentation de chalnes de caractdrcs ordinairement trai- 
ts comme dn <^urrences simples: 

Ex: aujourdliui (d«ux occiunnca) 
Ex: e'«t-A-din (qu^n occumncea) 

d) Les camctdres sp^iaux qui ne sont pas reconnus comme siparateurs d'occurrences peuvent 
fitre utilise dans un texte pour forcer la concatenation de deux mots: 

Ex: aujourd/bui (um occurraica) 

e) Lors de la segmentation, les caractdres en majuscules sont convertis en minuscules. 

f) Lors de la segmentation, le programme peut prilever une chalne de 1 ft 8 caractires qui 
sert de reference au debut ou ft la fin (position fixe) de chaque ligne de texte. 
Cette reference est amgnee ft chaque occurrence dans la ligne. 

g) Le fichier des mots protege ranstitue une banque de mots pouvant etre seiectionnes ft 
Tavance et segmentes en un seul bloc. Ce fichier doit etre cree avant de commencer la 
segmentation (voir la partie 2.2, option 10). 
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Fmctionnement 

m Choisir I'option 02 de P^cran Tl; Tdcran suivant se pr^nte comme suit 



LEMMATISEUR ••**ieginMitfttJoo Til 

Quel at 1« nam du corpua A McmenUf? 
<)tid OT« 1« nom du flchio- dw nwta pn>Mg«i? 
Qufil Mt la Don du ficblo- d« oeounncisfl? 
Poiittoi d« d4but du t«xt« A Mfmoitcr? 1 
Podtkw dfl (UlMit de U tone r^irmcoT 0 
I><«giicur d« U MM rtfArmce? 0 



Description des paramktres pcur la segmentaiion 

Paramktre du corpus d segmenter (il doit itre de format DOS): 
Entrer le nom du fichier & segmenter. 

fix: B;gglM*V3 (ou CORPUSM^ (RETOUR) 

Parametre du fichier des mots prtHigis: 
Entrer le nom du fichier comprenant la banque des mots proteges. 

Bx: BAtOTPRO (ou MOTPRO^ (RETOUR) 

Paramitre du fichier des occurrences: 
Entrer le nom du fichier resultant de la segmentation. Ce fichier des occurrences sera de format 
DOS; ainsi 11 faudra lui donner Textension .TXT comme suit 

EJt:asMfiaH2LI2£I fou MOTSOl.Tm fRETOim) 

Parametre de la fK>sition de d4but du texte d segmenter: 
Entrer un nombre correspondant k la position du premier caractfere du texte d segmenter (par 
d^faut jy. 

Ex: i (ou ifl) (RETOUR) 

Parametre de la fH>sition de d^but de la zone rifirence: 
Entrer un nombre correspondant k la position du premier caractdre de la zone r6f6rence (oar 
d6faur 0): 

Ex: 2 (ou 23) (RETOUR) 

Parametre de la longixw de la zone rifirence: 
Entrer un nombre correspondant k la longueur de la zone occup6e par la reference (par d6faut: 

Bx- fl (ou fi) (RETOUR) 

■ Pendant hi segmentation, T^cran ci-dessous s'affiche comme suit 
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VEUILLBZ PATIENTER 
Segmentation en couxv... 

• A la fin de la segmentation, le systime retourne A r^cran TK 

OPTION 03: Transfert d'un corpus sur disque rigide 
Description 

Cette fonction permet le transfert d'une banquc de donn^es dans le repertoire d6sir6 d'un disque 
rigide* 

Fonctionnemertt 

■ Choisir Toption 03 de T^cran Tl; T^cran T3I s'affiche comme suit 

TRANSFERT ♦♦♦♦ 6cran T31 

Nom de la banque k truuifArsr sur disque Hgid«; 

Nom du repertoire reeevnnl la banque;^^ 

(Menu pr^cMent: PfDn) 

■ Entrer le lecteur et le nom de la banque de donn6es^ Ex: B.Corpus (RETOUR) 

■ Entrer le nom du repertoire qui recevra la banque de doan6es. Ex; CjCorpus (RETOUR) 

■ Le systdme retourne A Ticran Tl. 

2*2 G^n^ration et malntlen de la banque de donnies 

LEMMATISEUR menu g^nAral 

(01) Traitement fMiftUminaire du corpus 
ISSl Pension et tnalntien de la baneue de donn^ 
(OS) Lemmaliealkm du c^pue 
(04) Prieentatioa dee rteUtats 

Bntw le numliro emeepondan^ 4 voire chobc: 0 
(Quitter PgDn ou RETOUR) 

O - 
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■ Pour activer Toption 02, taper 2; un second menu s'affiche comme suit 



L wnm B rif eur fftoAra^M el mainikn «cran Gl 

(01) BaaqtM de ionMm (03) Cofpus 

et M index (03) Dktionnaira 

MiM ftjour 

(04) Banqufl moti «3idi» 

(08) BanqiM d« donnto quani aux tnoto «xclus 

(06) BmoqiM d« doaoto quaat aux correetiotia 

ftppoii^ M ilktlonnaire 

(07) Tftbles dtt c^^torkm grunmatieal^ 

(08) Imlex da U bmnqiM de dmnto 

(09) Index du dieti«m«ir« 

(10) BaaqM d«f mots pn>Mg«« 

Entrer ie n^n d« voire banque de doonto: 
Eotm Ifl num^ eomepondant & votre chol^: U 
(Mrau pi^eMent: PgDn) 



« Ce menu (6cran Gl) pr6sente 10 options. II faut entrer le code du lecteur suivi du nom de 
la banquc de donn^es. Ex: B:Corpus (RETOUR) 

■ Ensuite, entrer le num^ro du choix. 

• Pour retoumer au menu g6n6ral, taper PgDn. 



OPTION 01: G6n6ration de la banque de donn^ et de ses index (6cran Gil) 
Description 

a) Cette fonction g6ndre un nouveau fichier des occurrences avec ses index, en partant d'un 
corpus & traiter en format DOS. On pent reconnaltre les fichiers g6n6r6s par la forme de 
leurs noms, comme suit 



fichier DOS du cotpue 
fichier des occurrencee 
index eekm te xao% 
index eelm la poeilion 



XMOoooot.TXT 
90CXXXXXX.DBF 
xxxx-occNTX 
xxxx*no.IfrX 



Ex; Corpus28.TXT 
Ex: CorpuflgS.DBF 
Ex: Corp-occ NTX 
Bx: Con>-no,hfTX 



b) Avant de procdder k Tutilisation d'une nouvelle banque de donn^, il faut s'assurer de la 
presence d'un dictionnaire et de s^ index. Si Ton veut commencer avec un nouveau 
dictionnaire, vide au depart, il faut le g6n6rer avec Toption 09 (mise & jour des index du 
dictionnaire). 
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Fonetiimnement 

m Choisir Toplion 01 dans Tdcran Gl; r^ran Gil s'affiche comme suit 



LemmAtiMur •** 



^mn Gil 



Ccmrmioo d'un fl^i^ DOS m fichl«r DSABE HI 
el crMkm index* 



Entm 1« wsm du flchin d« fomuU DOS: 



(M«nu prMdm%: PgDn ou REl'OUR) 



■ Cet 6cran perinet d^entier le oom du fichier en format DOS pour la conversion. Ex: 3:Cor- 
pus2S.TXT 

m Ensuite, le systdme retourne & T^cran GL 



OFnON 02: Correction du corpus (6cran G21) 
Description 

a) Cette fonction pennet de modifier le texte avant de proc6der & la lemmatisation. 

b) Cette fonction efface toute trace de lemmatisation ant6rieur? sur le mot modif i6; il faut 
done reprendre sa lemmatisation. 

c) n est ft conseiller de reg^ndrer les index de la banque de donn6es (option 08) apr6s avoir 
effectu^ d^ corrections, sinon certains il^ments corrig^ soot traites par le syst^me seule- 
ment aprfes les autres; autrement dit, leur traitement se fait comme s'ils 6taient ajout6s & 
la fin du texte. Ceci pent etre un inconvenient, mais ne constitue aucunement une erreur 
de procedure. 



Fonctionnement 

■ Choisir Toption 02 dans T^ran Gl; I'^cran G21 s'affiche comme suit 



LemmAti«aur Correclion 



6cr&n 021 



l:lir« 
4: ^oul«r 



2: modifier 
5: cofitinuer 



3: enlever 
6: iortir 



Cod« d*op4fBtlon? 0 



Ntunto) de la rii^tmtt: 



PoDctuation: 



(Esc4ciilk>ii de ropte^on: PgDa) 
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■ Entrer le code d'op^ration corrcspondant au choix, de 1 A 6. , . wir !a descrip ion ci- 
dessous.) 

■ Ensuite entrer le mot & rechercher pour la correction (30 caractires maximum), si ce mjt 
n*est pas pr6cis6, un message signalera cet oubli. 

■ Ensuite entrer s'il y a lieu le signe de ponctuation qui suit le mot. Si ce signe n'est pas 
pr6cis6, il sera ignore dans la recherche. 

■ Ensuite entrer le num^ro de ligne oO se situc le mot (8 tmractdres), si ce num6ro n'est v)as 
precis*, le premier cas dans Tordre du texte sera traits. 

■ Ecfin, entrer le numiro de r^firence. Si ce numiro n*est pas pr6cis6, Ic premier cas, dans 
To/dre des r^f^rences du texte, sera traits. 

■ Pour activer Topdration de correction, taper PgDn. 

■ Pour retoumer h I'^cran Gl, choisir Toption 6. 



DESCRIPTION DES CODES D'Op£RATIONS: 

1: 'ire: Cette operation doit pr<N:^er toutei; les autres. Elle trouve Toccurrence demand^e 

selon son num^ro de ligne et Faffiche en contexte. 
Z* modifier C«tte operation permet de remplacer Toccurrence af fich^ en entrant un autre 

mot et la ponctuation qui Ta^miMigne dans T^pace pr^vu k cette fin. 
3: enlever Cette operation permet d*enlever Toccunence affich6c. Cependant, dans le cas oii 

cette occurrence est suivie d'une ponctuation, il fauura la reporter sur le mot pr6c6dent. 
4: ajouter Cette operation ajoute un mot h ia suite de Toccurrence affich6e en contexte. II 

faudra reporter la ponctuation qui Tacco^npagne ft la suite de ce nouvel ajout. 
5: continuer Cette option donne la possibility le r^piter reparation pr^Wenie. Ex: Si I'ope- 

ration pr6c6dente 6tait de LIRE le mot SOLEIL, cette operation irait lire le prochain mot 

SOLEIL dans le corpus. Le principe est le mdme pour les autres codes d^op^rations. 
6: sortir Cette option permtt de suspendre la fonction et de revenir ft T^cran Gl. 



OPTION 03: Correction du dictionnaire (6cran G32) 
Description 
Cette fonction permet 

a) d'inscrire un lemme pour un mot absent du dictionnaire; 

b) d'ajouter un lemme {X3ur un mot present au dictionnaire; 

c) d*enlever un iemme pour un mot; 

d) de changer I'ordre dans la liste des lemraes pour un mfime mot. Ccci permet de fixer le 
choix prioriiaire (le premie'-) lorsqu'un mot a plus d'un lemme dans le dictionnaire. 



Fonaionnemetu 

m Crhoisir Toption 03 dans TAcran Gl; V&cmz s'affiche comme suit 
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CorrecttoQ 



QmI «rt }« ms% h melliv h Jour? 



(Menu iH^i^deol: PgDn ou RETOUR) 



Entrar ft r^cran le mot ft mettre ft jour dans le dictionnaire. Ex: Quel est le mot ft mettre 
ft iofir? soleil (RETOUR) 

Si le m^A n^est pas present au dictionnaire, l^dcran G33 s*affiche, comme ci-dessous, avec le 
memge suivant en haut de Tdcran (avec le mot ''soleil*' comme exemple): 



Pour inscrire un lemme au dictionnairf), taper le lemme vis-ft-vis le code de selection II, 
suivi de RETOUR. 

Taper sur la m£me ligne le ccKie grammatical* suivi de RETOUR, puis taper 1 1 ft la fin de 
la ligne suivante afin d*imposer le choix num^ro 11. 

Si le mo^ est present au dictionnaire, T^ran G33 s*affiche comme suit 



L'occumoe« (t^l) m% &btml« au dtetfoimmire. 



Meruit 033 



ioleU 




cod« gmni&alical 

10: nom 

10: prcmom 

30: conjonctioii 

40: v«rtM 

50: ftdvftrb« 

60: pHpoiition 

70: coordoimant 

aO: int«rj^tion 

90: Autra 



11: tdeU 



Enirer Ic code c;jrreflpoDddnl au temim d^rt 0 
L« cod€ 99 permel de tutpendre U tMico. 
(Ex^udon de I'op^^km: PgDo) 



Pour fijouter un nouveau lemme au(x) lemme(s) d^jft existant(s), ajouter un nouveau code 
grammatical ft la ligne 1 1 et inscrire 1 1 ft la ligne suivante* Cette fonction pent modifier 
rortliographe d*un lemme. 
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Sx: k mol SOLSIL «^ ioscril dm le dktioniifttr* mrmc 
W codt gnmmmtieal 10 ^ on rrat hil ^ouiw un 

M). n faut 

imcAikr eomm* rait: 

1: I'tenn OSS dcmaada U mot h mHtn i jour: tap«r 

fifilc^ raivi 60 RSTOUR. 
3: r«enn nihroat (OSS) i>rtecBt« to oiot recbefcM, am 

Iraanw «t «<» code gramiutieal (eod* d« tticetkm 1 

dc r«cian OSS). 
S: » U 11, l« mot-IramM «st •fiSch4, U fiuit 

bwATBT h cettm Ugm la nouvcsu code grammatical at 

tapar 11 4 la ligna raivaata. La nouvaau iaomo at 

•joati au dktionn&ir*. 

■ Pour enJever un lemme, ou en changer Tordre de priority, faire deux RETOUR successifs 
vis-4-vis le code de selection 11, puis inscrire & la ligne suivante le code de selection du 
lemme t traiter. Ensuite, T^ran G31 s*affiche comme suit 



*•* Lemm^iaeur *** Correction 6cran GSl 

(01) Enlaw k lamma 
(03) Modifiw aa prk»rit4 

Satrw la coda conmpoadaiit k rotn eboix: 1 
(tdmu prteMuit: PgDn ou RETOUH) 



■ Pour enlever le lemme: taper 1. 

■ Pour changer Tordre de priority d*un lemme: taper 2. 

■ L'toran G33 reviendra s'afficher avec les modifications compl6t6es. 

■ Pour sortir de Ticran G33 et retourner ^ T^cran Gl, taper 99. 



OPTION 04: Mise & jour de la banque des mots exclus (6cran G41) 
Descriptim 

a) Cette fonction permet de specifier les mots qu*on ne d6sire pas lemmatiser. Ces mots sont 
inscrits dans le fichier des mots exclus et servent & marquer les occurrences identiques 
dans le fichier d^ occurrences (voir Toption 5 ci-dessous). 

b) La liste d'exclusion est utile surtout pour ^carter des mots frequents qui n'auraient pas de 
pertinence pour T^tude; 1^ articles, par exemple. 



Fonctionnement 

■ Choisir I'option 04 dans Tdcran Gl; Tdcran G41 s'affiche comme suit: 



ERIC 
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*** Lgmmatlwxir *** mod« d'axchaioo tena 041 
(*Amu prteMent: PgDa ou RETOUR) 

■ Entrer le mot & exclure (30 caractftres ou moins). (RETOUR) 

■ L*6cnui G41 redemande aprds chaque mot exc'u le pxt>chain mot & exclure. Pour terminer la 
session et retoumer & ''#'^ran Gl, ne rien entrer et faire un RETOUR. 



OPTION 05: Mise & jour de la banque de donn^es quant aux mots exclus (ecran G51) 
IXescriiHion 

a) Cette fonction marque dans le fichier d^ occurrence celles qui sont ft exclure de la 
lemmatisation. 

b) n faut faire cette mise & jour lorsque de nouveaux mots ont &t& ajout^ au fichier des 
mots exclus (Poption 04). 



Fonctimnement 

■ Choisir Toption 05 dans I'ficran Gl; T^cran G51 s'affiche comme suit 

*** Lemmatiseur ginAntion et mainti«n temx G51 

VEUILLEZ PATIBNTER 

Mist & jour dOT mota exclus d* la banqu« 
da donates m coun d'exteution 

■ Aprds le traitement, le systfeme retourne k I'^cran Gl. 

OPTION 0<5: Mise k jour de la banque de donn^es quant aux corrections apport^es au dic- 
tionnaire 

Description 

a) Chaque correction faite au dictionnaire (option 03) est inscrite dans un fichier des correc- 
tions. Ce fichier comporte ainsi une liste des modifications qui ont €t6 faites aux entrees 
du dictionnaire. avec la date de reparation. 

b) Cette option permet d*une part de g^rer le fichier des corrections, en retirant de la liste 
celles dont on s*est d^'ji. occupy. 

c) D*autre part, cette option permet de faire r^percuter dans les banques de donndes di'ik 
lemmatis6es, les modifications qui auront 6X6 faites dans le dictionnaire depuis la lemmati- 
sation des banques. 

o ^ 

9^ ^C' 



20 



F(m€ti<miKment 

m Choisir Toption 06 dans l*6cran Gl; 
Tteran G61 s^afTiche comme suit 



LoasmatiMur ste^ntkm •! ouUnUan «cna G81 
•*•• Dktkwnain! actif: b:dkt-I«an 

(01) Traitor U liit« d« ratoaits 

(03) .^^ortv lu modifieatiofu au(x} eorpui 



Entnr le numtoo c ormpon dant 4 votra ehoix: 0 
(Menu pr«c«dflnt: PgDn ou RETOUR] 



ERIC 



■ Ce menu (6cran G61) pr6sente trois options. Toujours de la meme fa?on, entrer le choix. 

■ Pour sortir de cc menu et retouraer ft T^cran Gl. PgDn ou RETOUR. 

CHOIX 01: Trailer la liste des retraits 
Description 

a) Cette fonction regroupc trois traitements concemant les corrections apport6es au diction- 
naire, ce sont 

option 01: Impression de la liste de retraits. 

Cette fonction permet Tir pression d*une liste de retraits dans le fichier des correc- 
tions apport^es au dictionnaire, avec en-tete comprenant la date de Timpression, le 
litre, le nom du dictionnaire concern*. La Uste comprend quatre colonnes dont, sue- 
cessivement» unc pour le mot, unc pour le numdro de lemme, une pour le code gram- 
matical et la demiire pour la date de modiHcation oi le retrait a 6t6 effectu6. 

option 02: Suppression des modifications du XXXX-XX-XX au XX XX- A XX. 

Cette fonction permet le retrait dans le fichier des entries pour les corrections, des 
modifications apportdes entre deux dates pr6cises. Dans Tficran G621 (voir Fonctlon- 
nement, apris Toption suivante) un message sWiche d^ que cette option est activ^e 
demandant la date de d^but et ceUe de la fm de la p6riode ft supprimer. Pour annuler 
ro'.^ration, laisser les champs blancs. 

option 0?: Suppression du fichier de modifications de ce dictionnaire. 

Cette fonction permet la destruction des modification du dictionnaire. Dans i'^ran 
G62I (voir ci-apr6s) un message va s'afficher comme suit 



Conflpinw la dottruction du fichier de eorreetioiu (0/N): 



21 



Fonctionmmem 

u Taper 1 dans r^mn G61; 

rteran G621 s*affiche comme suit 



L«nun«tifieur *** gto4r»ti<m et inainti«Q Hnn G631 



(01) Imprtikm d« la Uit« d* rttnits 

(03) Sunmnkm dei imxlificatioiw du XXXX-XX-XX 

Ml xxxx-xx-xx 

(OS) Suj^mrioo du fichicr dn modification! d« ce 
(Mftkwinaif 



Eotrar 1« ntUD^ mrapondant & votra cboix: 

(Menu prteMmt: PgDn ou RETOUR) 

■ Taper le num^ro de votre choix. 

■ Pour retoumer & rdcran G61, PgDn ou RETOUR. 

CHOIX 02: Apporter les modifications f u(x) corpus 
Descriptim 

a) Cette fonction permet la mise & jour des banques de donnas quant aux modifications 
contenuM dans le fichier des corrections. 

b) Dans une s^ce, Tutilisateur pent sp^ifier un maximum de 10 fichiers des banques de 
donn^es & corriger, yil y en a plus, il faut r6p6ter I'opiration, 

c) n faut bien noter dans chaque champ la bonne structure des repertoires et sous-r6pertoires. 

Fonctionnement 

■ Taper 2 dans T^cran G61; 
r6cran G63 1 s'affiche comme suit 

*** LcmmstiMur *** ftaAration «t nutinti«n 4cran G631 

Fonnat des ncam de coipua D:\SOUS-DIR.EXT\BANQUEXX.EXT 

f» c«r»et*rM 



Entnr un caneite* pour d<but«r la miae ft jour: , 
(Menu ptMAm% PgDn ou RETOUR) 

ERIC Sv 
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■ Oiaque champ peut a^ntenir vingt-huit caract^r^. 

■ Pour d^buter la fonction, taper une touche quelconque. 

■ Pour Feveoir k Tteran G61, PgDn ou RCTOUR. 



OPTION 07: Mise & jour de la table des categories grammatkales (6cran G71) 
Descriptimt 

a) Cette fonction sert & changer les denominations des categories grammaticales dans la table 
de r^rran G33 (on la retrouve partiellement encadrte & droite de T^cran). 

b) Chacune des categories peut fitre nommee selon les besoins. 

c) Chaque nom de categoric occupe un champ de 20 caracteres, il faut done une expression de 
20 caracterra ou moins. 



Fonctiormeffunt 

m Choisir Toption 07 dam Tecran GI; recran G7I s*affiche comme sale 



*** Lamnatiaaur *** (te«ntion at maintka ierma 071 
DtFJStmOti DES CAT£GORIES GRAMMATICALES 
10: a&sa 80: Pffteorition 



iOi^aaam TD: coordonaaiit 



^fifiBiSUfiSB 80: tntwiection 



ywfa* 80: autre 

50:«diwrt>a 

(Mffiiu prte4deot mi axfcutimi de rop^ratkm: P^n) 



■ Taper dans les espaces appropries les nouvelles denominations suivi^ de RETOUR. 

■ Les denominations sont automatiquement modifiees dans la table de recran G33. 

■ Apres le traitement, le systeme revient & recran Gl. 

OPTION 08: Mise k jour des index de la banque de donnees (ecran G81) 
Descriptim 

a) Cette fonction regenere les index du fichier des occurrences. 

b) La regeneration d^ index de la banque est & conseiller lorsque des operations de correc- 
tion (option 02) ont ete effectuees sur le corpus, ceci afin d'assurer que les fichiers 
d*index retrouvent une organisation simple et efficace. 

Fonctimnement 

m Choisir Toption 08 dans recran Gl; recran G81 s'affiche comme suic 

ERIC Jl 
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Lomnstiaeur *** gta^ntkm «t initinttMi icnn 081 



VEUILLEZ PATIENTER 
MIm h lour <l«a liidM d« U bwiquc 



■ Aprte le traitement, le systime revient & V€cnn Gl. 



OPTION 09: Mise 4 jour des index du dictionnaire (icran G91) 

a) Cette fonction reg6ndre les seuls index du dictionnaire. Cette operation est recommand^e 
lorsque le nombre de corrections qui ont €U apportdes au dictionnaire risque de complexi- 
fier les index au point de ralentir leur fonctionnement 

b) S*il n*y a pas de dictionnaire dans le repertoire approprid, cette fonction en cr^era un avec 
le nom si^ifid lors du lancement du programme (voir Vue d'ensemble des operations). 



Fonctitmnement 

■ Choisir Toption 09 dans r^cran Gl; I'^cran G91 s'affiche comme suit 



LsmmatiMiir *** gto^rmtion at auintien fenn G91 



VEUILLEZ PATIENTER 

MIm ft Jour de« index da ia banque 
de doante an eoun d'axteutioo 



■ Aprto le traitement, le systdme revient a T^cran Gl. 



OPTION 10: Mise k jour de la banque des mots prot6g6s (6cran GlOl) 
Description 

a) Cette fonction cr6e le fichier des mots prot6g6s s'il n'existe pas, ou, s'il existe d6ja, 
permet la modification de son contenu. 

b) Ce fichier sert exclusivement au processus de segmentation (voir 2. 1 Traitement priliminaire 
du corpus^ option 02). Si ce fichier n'est pas cr66 ici, la segmentation ne pourra fonc- 
tiooner. 



Fonctionnement 

■ Choisir Toption 10 dans Ttoran Gl; I'^cran GlOl s*affiche comme suit 
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LemnutiMttr ***** Mots|W(^^ tenoQlOl 



QimI eit k nom du fichkr d« nwta proUfte? 



■ Entrer le code de Tunit^ de dk lue suivi du nom du fichier choisi; 

Ek BrMOTPRO fou CJrfOTPRQl fou MQTPRQl (TtETQtIR\ 

■ Ensuite T^cran G102 s'affiche comme suic 



LflOUBAtiieur ***** Mota proMgii «cnn G103 



1- AFPICHI^ 

3- AJOUTEB DBS MOTS 
S- COKIUOER UN MOT 

4- TRIER 
t- FIN 

CHODCT 



■ Entrer le chiffre correspondant k Toption d6sir6e (RETOUR); 

■ Pour sortir de cette fonction, taper 5, et le systdme revient k r^cran Gl. 



2.3 Lemmatisatlon du corpus 



♦**• LraiMATISEUR **•* nwnu gto«nl 

(01) Traitemmt i>rtiUnriiiair» do cwpus 

(03) Ota^«tlon et maintian d* ia bsnquc ds donnte* 
iSSX Unwwtiaation du cofpm 

(04) Prtemfta^ d« rtailtata 

EntTK' k numiro comspcmdAat 4 Totr* eht^: 0 
(Quitt«r. PgDn ou R£TOUR) 



■ Pour activer I'option 03, taper 3; un second menu s'affiche comme suit 
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Lfmwtimir *** lamm>tl«>tlon Aeran LI 



(01) LwrenatlwU^oa wtraiatiqu* 

(03) LasBHitlMttNi isl«ncthr« 

(OS) L«Biiiatb»tioa e<»i|^B«itain, ahmui kodcsl 

(04) Lemmatinkiim com^mntaJn, iihr««i cMit«xtuflI 

Botm' la Dom d« votre baaqiw d« (kowtei: 

Eatrtr 1« numirD eomspondut 4 T€>tr* cbobt: 

(Mmu pt4c4d«it: PgDo) 



« Ce menu demande, en premier lieu, le nom de la banque de donn^es suivi de RETOUR; Ex: 
S:Cor/ms (RETOUR) 

■ A ia ligne suivante faire un choix parmi ies quatre modes de lemmatisation. 

a Pour revenir au menu g^n^ral: PgDn. 



OPTION 01: Lemmatisation automatique (^ran Lll) 
Description 

a) Cette fonction traite, en mode diff6r6, chaque entree dans le fichier des occurrences (& 
Texception de celle? qui sont inum£r6es dans le fichier des mots exclus) en Tidentifiant au 
mot-forme <»}ms»^rable dans le dictionnaire. 

b) Pour chaque occurrence dont la forme » trouve dans le dictionnaire, une relation d'identi- 
fication ft cette forme est 6tablie. Ceci ^uivaut & Tassignation d*une cat^gorie, d*un lemme, 
d*une precision lexicale si elle existe dans le dictionnaire (voir Toption 03 de T^cran LI). 
La cat^orie du mot-forme Mt 6galement assign^ directement ft r<xxurrence dans le fichier 
des occorren^. 

c) Les omirren^ identifi6es ft Taide du dictionnaire sont marqu^K comme lemmatis^es; celles 
dont la forme n^est pas prdsente dans le dictionnaire conservent leur statut de mot non- 
lemmatis^. 

d) S*il y a plus d*un lemme pour ime mdme occurrence, le lemme prioritaire (le premier dans 
Tordre) lui ^ra assign^. La situation d*ambigu!t6 sera signal^ pour traitement ult^rieur 
(option 02, ci-dessous). 



Fonctionnemem 

m Dans T^cran LI, entrer le nom de la banque de donn^es suivi de RETOUR; Ex: B .Corpus 
(RETOUR). 

■ Ensuite choisir Toption 01 (taper 1); T^cran Lll s'affiche comme suit: 
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VEUILLEZ PATIBNTER 

L««nm»tk»tloD d« Im bmaqua d* doont^t 
a coon d'«c4cation. 



■ Un message, s'U y a lieu, avertit de ^absence de mots au dictionnaire. L'utilisateur doit 
done les inscrire par lemmatisation interactive (voir Toption suivante). 

■ Aprte rop6ration, on retoume & l'6cran LI. 



OPTION OZ- Lemmatisation interactive (dcran L21) 



Descriptiai 

a) Cette option traite en mode interactif les occurrences afin que Tutilisateur puisse inter- 
venir dans rassignatM)n des donn^ d*analyse. 

b) La lemmatisation interactive se fait selon quatre sous-options (voir ci-dessous). Dans chaque 
cas, roccurrence est affich^e en contexte (6cran G33). 

c) Les donn^ d'analyse foumies par I'utilisateur sont ajoutees ou bien au dictionnaire, ou 
bien au flchier des occurrences. 



Fonciimnement 

m Dans Tteran LI, entrer le nom de la banque dc donndes suivi de RETOUR. 
■ Ensuite choisir Toption 02 (taper 2); I'^cran L2I s'affiche comme suit 



LemmstiBeur lemmatUstion feran L21 

(01) L«niiMtiratl<» de tous kt mot* n'syiuit pu de lenune 

(03) L e m matUstion de toua lee mofce ambigue 
(OS) Leaunstimtion d'un mot 

(04) LMunatieetira de touta iei oeeunencef d'un mot 
(09) Suepoidmi de la lemmatieatloo 

Entrer le code «>Rap<mdsiit k votre choix: 0 



m Ce menu pr6sente cinq choix dont les quatre premiers sont les possibiIit6s de lemmatisation 
interactive. 

■ Entrer le code de votre choix, selon le cas. 

■ Pour suspendre la lemmatisation et retoumer & T^cran LI, entrer 05. 
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CHODC 01: Lemmadsation de tous les mots n*ayant pas de lemme (^ran G33) 
Description 

a) Cetto foDction pennet de reprendre la lemmatisation de toutes les occurrences dont la 
forme est absente du dictionnaire. 

b) Les cas sont prfoentte & Tteran dans Tordre de leur apparition dans le corpus d*origine. 



Fonctiwinement 

u Taper 1 dans T^ran L21; T^cran G33 s'affiche comme suit (les caract^ies soulign6s consti- 
tuent un exemple): 



*** LwnmfctUaur *** «enn OSS 

ligw: i riftemc: 00000001 

1» luiw I'Mt Iwie tuBta avant 1< iolaU 



eodt l«QUM(t) code gramm. cod« gnmnutical 

10; nom 
30: pitMMm 
M: ctmjo&ctioa 
40: rwtba 
SO: Adv«^ 
SO: |»^oaitio& 
70: coordonnant 
80: Interjection 
90: autre 

iusSS SSI 

** Entrer le code comipoodant au lenune dHiri IX 
Le code 09 pennet de auependre la •essioo- 



(Exteution de Topdration: PgDn) 



■ ^occurrence identifide par le signe est pr6sent6e en contexte avec son numiro de ligne 
et sa r^f^rence. 

■ Les cat^ories principales sont affich6es sous la rubrique "code grammi cal", avec leur 
ddnoffiination par d^faut (voir Toption 07 de Tteran Gl pour modifier Tappellation des 
categories). 

■ Vis-ft-vis le code de selection 11, Tutilisateur inscrit son choix de lemme (maximum 20 
caract&res avec RETOUR) et de code grammatical. Ce dernier peut prendre n'importe 
laquelle valeur de 0 ft 99. 

■ A la ligne suivante, il faut inscrire 11. 

ERIC 
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d'activer I'assignation des donntes dans les fichiers d»occurrcnces et de dictionnaire. 
Pour suspendre la s6ance et retourner & r^cran L21, taper & rendroit d6sign6. 

CHOrx 02: Lemmatisation de tous les mots ambigus (6cran G33) 



Description 



*^ ™!!^, le^nmatiser toutes les occurrences de mots ambigus tels que 

m&rqu6s lors d'une lemmatisation automatique 

b) L« cas sont pr*sent6s a I'ficran dans I'ordre de leur apparition dans le corpus d'origine 

c) Les occurrences trait^es perdent leur statut de cas ambigus oTigme. 



Fonctionnement 



lem'un^^em^ caract^res soulign6s consti- 



L^mmatiMur derail OSS 

ta kng »'«tt »ev^ iu«f «>YMT^ h ITff!?ii 



code lenuiM(s) 
3: k 



2S 



coda grammatical 

dO;cotiJoiKtion 
40nrert>a 

60:pr«poiition 

TOrmordoanant 

80:inl«rjection 



U: 1ft 22 

Eiitr«r le code cormpoodmnt ftu \mnxtm 
L« code 99 permet de ei»pendf« 1« i^on. 
(&c4cutioii de ro|>«r»tioii: PgDn) 



LJoccurrence est pr6sent6e comme au choU pr6c6dent (choix 01), avec. en plus, les lemmes 
et les codes grammatjcaux possibles (codes de selection 1 et 2) 

Ulemme qui a d*jA m assign^, par d^faut ou par choix, est signal^ par un astirisque 
(code de selection 1). ^ 
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■ L*utiUsate!ur peut inscrire ua autre choix au code de sdlectioa si les choix existants ne 
conviennent pas (maximuin de 10 choix par mot-forme). 

■ A la ligne suivante, rutilisateur indique son choix (01, 02 dans Texemple, ou 1 1 sUl veut 
ajouter une autre possibility). Le choix par difaut est inscrit d*avance k la ligne 11. 

■ Faire PgDn et la marque d*ambigulti est annuls. 

■ Pour suspendre la stance et retoumer & Tteran L21, taper 99 sous la ligne 11. 

CHOIX 03: Lemmatisation d'un mot (6cians L22 et G33) 
Description 

a) Cette fonction permet de lemmatiser une seule occurrence d*un mot, ce qui est utile surtout 
pour corriger une erreur. 

b) L*ocGurrenM prteentto ^t la premiere dans Tordre alphabdtioue en commandant & la ligne 
sp^cifi^ par Tutilirateur. Si aucune ligne n*est sp^ifi^e, la ' 'emidre occurrence du mot 
dans le corpus est prisent^e. 

F onctionnement 

■ Taper 3 dans T^cran L21; T^cran L22 s*aff'.che comme suit: 

*** LcmmatiMur *** l«mmatis&tioa «cran L33 

Quel eat la imrt 4 lonnwtiea? 

A ouallt UfB« le nwt t^anlit-UT __0 

(Mrau ii^iteMast ou exteution d« I'opteitiw: PgDn) 

■ Cet ^ran demande le mot & lemmatiser. Ecrire le mot suivi de RETOUR. 

■ On peut inscrire le numiro de ligne pour pr6ciser la recherche; ensuite, faire un RETOUR. 
En Tabsence du numiro, la recherche se fera k partir du d^but. 

■ L*teran G33, comme iK>ur les choix pric^dents, s'aff iche et fonctionne de fa?on semblable. 

■ Pour suspendre la session et revenir & T^cran L21« tape 99 dans le bas de T^cran. 

CHOIX 04: Lemmatisation de toutes les occurrences d*un mot (^crans L22 et G33) 
Description 

a) Cette fonction permet de lemmatiser successivement toutes les occurrences d*un mot. 
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b) Les cas sont pr^sent^ & r^cran dans Tordre de leur apparition dans le corpus, k partir de 
la Ugne sp*cifi^ par rutilisateur. 

F onctimnement 

■ Taper 4 dans Tteran L21; ce choix conduit & T^ran L22 (comme pour le choix pr^cddent). 

■ On doit specifier le mot et on peut indiquer ia ligne. 

■ Le systdme passe de r^cran L22 t r^cran G33. Le f onctionnement de ce choix t scmbla- 
ble au choix 01 et 02. 

■ Pour suspendre la session et revenir k Tdcran L21, taper 99 sous la ligne 11. 



CHOIX 05: Suspension de la lemmatisation 
F onctionnement 

m Taper 5 dans T^cran L21 pour retoumer i I'^ran LI. 



OPTION 03: Lemmatisation complimentaire, niveau lexical (6cran L31) 
Descnptim 

a) Cette fonction pennet d'ajouter des donn6es d'analyse & chaque occurrence d'un mot du 
corpus. Les occurrences sont traitdes successivemem dans I'ordre d'apparition dans le 
corpus. 

b) Les domi*es occupent un champ de 30 caract&res sans structure inh6rente. II incombe t 
1 ualisateur de d6finir ua format et une codification appropri6s h scs besoins. 

c) L'utilisateur peut choisir un champ de precision pour une occurrence parmi les possibilit6s 
d6j4 reconnues pour le lemme, ou en ajouter une nouvelle. H y a une limite de 20 pre- 
cisions diff^rentes pour chaque lemme dans le dictionnaire. 



F onctionnement 

■ Dans r^cran LI, entrer le nom de la banquc de donnfies suivi de RETOUR. 

■ Choisir I'option 03; I'icran L31 s'affiche comme suit 



Lmupstifeur ••* prteision 

Qufil cat 1« mot h pr«ci»ar? 

(M«t>u fiHUAtsa%: PgDn ou RSTOUR) 



4eran LSI 
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Taper le mot ft priciser. 

Ensuite Ticran L32 s*affiche comme suit (les caractires souli^n^ constituent un exemple): 



*** LrauMtlMur *** |n«cMod «cnui L33 

Ucm: I r^tonc*: 00000001 

la kiw ■'«wt lartc avBiit to wriril 

No. PrtcMon No. PrfeUon 



** E^trar la no. cMrcifMmdant mi mm dteiri 0 
La coda M pmnat d« atiapaodre l» xsaioa. 

(Sstfentioa da r^>dretioQ: PgEn) 

■ Dans rexemple (caract^res soulignds), il y a 2 prteisions pr^existentes. 

■ Entrer une nouveUe precision ft la ligne 21 au besoin. Chaque precision doit avoir 30 
caractires ou moins. (RETOUR) 

■ Taper 21 ft la ligne sous-jacente pour une nouveUe pr^ision, ou le num^ro appropri^ pour 
une p<mibilit6 existante (exemple: 7 ou 2 dans Ttoran L32). 

■ Ensuite, la fonction continue avec I'occurren^e suivante. Si la precision reste la mdme, 
taper deux RETOUR de suite. 

■ Pour suspendre h se^ion, taper 99 vis-ft-vis du numiro. On retourne ft r6cran L31. 
• Four retoumer ft Tdcran LI, taper PgDn ou RETOUR. 

OPTION 04: Lemmatisation compl6mentaire, niveau contextuel {6cran L41) 
Description 

a) Cette fonction permet d*assigner des codes d*analyse ft chaque occurrence et de les con- 
server dans le fichier des occurrences. 

b) La fonction pr^voit un seul champ non structure de 20 caract^res par occurrence. La 
codification du champ est taiss^e entidrement au gr^ de Tutilisateur. 

Fonctionnemeni 

m Dans Tteran LI, entrer le nom de la banque de donn^es suivi de RETOUR. 

40 
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■ Choisir roption 04; rteran L41 s^affiche comme suit 



Uanmatkmir i»«ckion tenn L41 

(01) Prtdriwi do tout— W» o ccur w ucw non pt*ei»6n 

(03) Ptteiskmd'tra mot 

(OS} PrtcWon d« toutc* let oceumoces d'un mot 

(04) PrtfcMm dm toutet la oecumncM rsttachtee & im« 
cat<8(»i« gmmastieak 

(05) Suip«iukHi de Ik l«xniiiati«ati(m 

Entrer 1« coda coiropoodant & votro choix: 0 



■ Ce menu pr6sente cinq choix dont les quatrc premiers sont des modalitfe de lemmatisation 
Mmpl^menmire. 

■ Entrer le code de votre choix, selon le cas. 

■ Voici ia description et le fonctionnement de chacune des options: 



CHOIX 01: Precision de toutes les occurrences non pr^cisdes (dcran L43) 
Description 

a) Cette fonction prisente successivement dans Tordre du tcxte toutes les occurrences du 
corpus qui n'ont pas encore 6t6 pr^isees h ce niveau. 

b) Toutes les occurrences sont ^ligibles, mfime celles qui n'ont pas it€ analys6es au niveau 
principal (cat6gorie et lemme). De cette fa?on, Tutilisateur peut escamoter le niveau prin- 
cipal et se servir de celui-ci s'il convient mieux k ses besoins. 



Fcnctionnement 



■ Taper 1 dans T^cran L41; I'^cran L43 s'affiche comme suit (les caractferes soulignis 
constituent un exemple): 



LuuiQstiMur pt«ciMon *cran L4S 

LigQ«: i. r«Mrenc«: 00000001 

1ft lUM g'cat levAe ftvant \^ 

Qu«U« at iB prieisioa: ITQ caractfaal 

** L« code 90 p«noet dc lutpradra U seoion. 

O 
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■ La precision ne pent excMet 20 caractdr^. 

m Si on n'inscrit pas de precision et qu'on tape un RETOUR, I'opdration se poursuit sur la 
prochaine occurrence non prteiste. 

■ Pour terminer la session, taper 99 suivi de RETOUR, on retoume k l'6cran L41. 

CHOIX 02: Prdcision d'un mot (6crans L42 et L43) 
Description 

a) Cette fonction pr^sente une seule occurrence pour precision, la i: emigre en partant de la 
llgne spteifite par Tutilisateur. 

b) Si To^urrence a d6ja 6t6 traits ft ce niveau, les nouveaux codes d'analyse remplacent les 
premiers. 

Fonctionnement 

■ Taper 2 dans r^cran L41; Tdcran L42 s'affiche comme suit 

Lemmtlseur prAciflioi} torn lA2 

Qu#l «ol l6 mol h prteieer? 

A quflU* ligD# 1^ mot appar»!t-U: 0 

(Menu prdc^at ou ax^utlon ropAration: PgDn) 

m Taper le mot t prdciser suivi de RETOUR, 

Taper le numdro de ligne pour preciser ia recherche; sinon cette derniere s'effectuera 4 
travers tout le corpus. 

■ Ensuite T^cran L43 s'affiche et s'opdre comme au choix pr^c^dent (choix Ol). 
fl Pour terminer la session, taper 99 suivi de RETOUR. 

■ Pour retoumer k Yhctm L41, taper PgDn ou RETOUR. 

CHOIX 03: Precision de toutes les occurrences d'un mot (^crans L42 et L43) 
Description 

a) Cette fonction permet d'analyser successivement , is Tordre textuel toutes les occurrences 
d'une m^me forme. 



34 

b) Les nouveaux codes remplaceront les premiers, s'il y en a qui sont d6ja assignds. 
Fmtctionnement 

w Taper 3 dans r^ran L41; I'^cran L42 s*affiche comme au choix precedent (choix 02). 

■ Taper le mot & pr6ciser suivi de RETOUR. 

■ Taper un second RETOUR au lieu de sp^if ier la ligne moins de ne pas vouloir c.->m- 
mencer au d^but du corpus). 

■ Ensuite Tdcran L43 s'affiche et s'opdre comme au choix 01. 

■ Pour retoumer de T^cran L42 k I'teran L41; PgDn ou RETOUR. 

CHODC 04: Precision de toutes les occurrences rattach6es ft une categoric grammaticale 
(6cran L41 et L43) 



Description 

a) Cette fonction permet d'analyser successivement, dans I'ordre textuel, toutes les occurren- 
ces des formes ayant la m«me cat6gorie au niveau principal. 

b) A I'aide de cette fonction, Tutilisateur pcut effectuer des analyses contextuelles d6taill6es 
pour une classe de mots voulue. 



Fonctionnement 

u Taper 4 dans I'^cran L41; un message s'affiche au bas de Tdcran L41, comme suit: 

Quel est U code d« esMgori* gnunin.>ticala? (RETOUR) 

■ La fonction recherche toutes les occurrences qui r6pondent h cette categoric grammaticale 
et les affiche une t la fois dans T^cran L43, qui s'opdre comme au choix 02. 

■ Pour terminer la session, taper 99 suivi de RETOUR. 



a) 
b) 



CHOIX 05: Suspension du traitement 

Pour suspendre K lemmatisation compl^mentaiie et retoumer a I'^cran LI: taper 5. 
Pour retourner au menu g^n^ral, taper PgDn dans Tdcran LI. 



2.4 PitscDtatioii des rteultats 
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••••LEMMATISI3UB menu gto«nl 

(01) TnttcmoBt prAliminsire dti 
(03) Q4oinUon ^ mainttai d* 1a tAnqut dt dotm4«t 
(08) LMBMteftlkm dtt c<nin» 
Priwaitftiton dim rftmliatm 

Entrar k numAro aamtiioiidaot 4 yolrs ehoix; 0 
(Quitl«r P^n ou RETOUR) 



■ Pour sortir du progiciel et retourner au DOS: PgDn ou RETOUR 

■ Pour activer Toption (04), taper 4; un second menu s'affiche comme suit 



UffunaiiMur rteiltata Sermn Rl 

(01) Index d^imto 

(03) CmcoitlBiie* 

(OS) I mpmri op du cor{H» 

(04) hnpwiil oa du dietkmaftlr* 

(05) Tmmtaxi d« U batunM tur baiid« magnAtique 

(06) Traatfart da U bMqu« ntr diiquette(i) 

U nom d« yo^ baaqut dm do«mto; 

&ilrir k oumiio conwpondBofc k Toira choiac: 0 
Manu prMdmit: PgDn) 



■ Ce menu comporte six utilimires permettant soit Timpression de diverges donnees (options 
01, 02, 03, 04), soit le transfert de la banque de donnees sur un autre $up(X)rt (options 05 
et 06). 

■ En cc qui a trait aux options 01, 02, 03, 04, dans T^cran Rl, le choix de Tun d'entre eux 
fait suite & un menu qui s'affiche comme suit 



UmmsiiMur Stiaction dei p«ripUriquefl*SELECSOR 

Si d» rtailtalA doivent Stn produiU, 
•oua qual formal d^tiraa-vpui lea obtenir 7 

(01) Surpapiar 

(03) Dan* unfidii«irfurdiaqu« 

(03) Sur papier l% mix diaqua 

(00) R^our att imnu prteMant 

Enim la numiro comspcndant k rolre cbobc 0 

(Termioar la taisie: PgDn) 
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Les trois premiers choix permettent la pr^ntation des r^ultats $ou$ trois former: 

optkn 01: i npiwi oo d«s doaa^ rar p«pi«r; 

<q»tioa Mt tnufnt dca d«in«M nir disque; 

option OS: Us dmix eptkHU ^^icAdantes wnt combing. 

Pour retoumer & V€cnn K\ taper 0. 
Voici la description de ces utilitaires: 



OPTION 01: Index des mots 
Description 

a) Cette fonction fait Timpression d*un index de Unites les occurrences de tous les mots d*un 
corpus. 

b) L*index est en ordre alphab^tique; d*abord selon les lemmes, et deuxidmement, selon les 
mots-formes du mdme lemme, ensuite, en ordre textuel d^ occurrences pour chaque mot- 
forme. 

c) L'impre^ion des pages se fait avec en-tete comprenant le titre, la date, le nom de la 
banque de donn6^ et la num^rotation de la page. 



Fonctionnement 

m Activer Timprimante. 

■ Dans r^cran Rl, entrer le nom de la banque de donn6es suivi de RETOUR. 

■ Ensuite choisir Toption 01. 

■ L*6cran SELECSOR va s'aff icher. Choisir un des trois choix. D6s que sont s6Iectionn6s les 
choix 02 et 03, deux message s*affichent au bas du menu, comme suit: 

Bmlm Ifl Bgffl fi^MfT ^MX^\ fSO caracttreal fRETOUR^ 

P<rtrM-vcm« exmmerm k« on-tMw ror le tBXto du fichiT? 

(O/N) fi 

■ La liste d^index s*affiche ft T^cran en m£me temps qu'elle sMmprime sur papier. 
• Aprds reparation, on retourne ft Tdcran Rl. 
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OPTION 02: Concordance (liste) (6cran R21) 
Description 

a) Cette fonction fait Timpression d*un index d^ime classe de mots assortis de leur contexte 
pour chaqi» occurrence. 

b) La concordant est en ordre alphab^tique des mots-formes et en ordre textuel des occur- 
reo^ pour un mftme mot-forme. 

4d 
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c) La s^lMtion des mots dans la concordance se fait selon les paraindtres d*analyse sp^cifids 
l>ar rutilisatetir. 

d) L*impressk)n des pages se fait avec en-t6te comprenant: le titre, la date, le nom de la 
banque de donn^ et la numirotation de la page. 

e) La concordance s*affiche & r^cran pendant Timpression. 



Fonctionnement 

m Activer Timprimante. 

■ Dans r^cran Rl, entrer le nom de la banque de donn^ suivi de RETOUR. Choisir I'opticn 
02. 

■ Ensuite Ticran SELECSOR va s'af ficher. Comme pour Toption 0 1 , fairc un choix et r^pon- 
dre aux message affich^s. 

■ Un mesj^g^ supplimentaire va s^afficher comme suit: 

Vottlw-yww ^wrtuw U concordsaai irfn<ral«7 (O/N) £. 

Si la r^ponse est positive, le traitement se fera simultandment. Si elle est negative, T^cran 
R21 s*affiche comme suit 



*** C<meordai>c« mot & atiMtionnar Scran R21 

Qiiri at k mot IsnuMT , (RETOUR) 

Qud aft la mot fonncT (RETOUR) 

Quelle est U r^tefoce? (RETOUR) 

Quelle ««t U aMwotia grammaticale? (RETOUR) 

Quelle eet le prtcWon mi oiveeu lexical? 0 (RETOUR) 

Quelle eet le ^nteirion mi nhresu eootextuel? 

RETOUR) 

Dteim-rous les n»ts exelos (O/N)? (RETOUR) 

Le mot ft sAleetimim egi-il conditimnel eu(x) iitot(B) 
|H4cMent(i) (oombn de mots: 0, 1, 3 ou S)? 0 (RETOUR) 

Le mot & sAleetioanar est-U eonditionnel &u(x) mot(s) 
•uivsnt(s) (oombt* de moU: 0, 1. 3 ou 3)? 0 (RETOUR) 

(Menu prAcMent ou exteutira de I'op^rstiOT: PgDn) 



• Apr^ reparation, on retourne & I'fecran R21. 

■ Pour retoumer au menu prdc^dent (^ran Rl): PgDn. 

■ Ce menu prisente divers choix dont la description d6taill6e suit 
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Description des paramktres de silection pour la concordance 

Paramktre: le mot lemme 
En spteifiant un lemme, Tutilisateur obtient toutes les occurrences de toutes les formes d'un 
m£me lemme (ex: pour toutes les formes d*un m£me verbe). 

Paramitre: le mot forme 
En spteiHant un mot-forme, Tutilisateur obtient 1m occurrences d'un seul mot forme. 

Paramktre: la rifirence 

En sp^ifiant la rdf^rence, seul» les occurrences appartenant h ia subdivision correspondant au 
corpus sont retenues. 

Parami,re: la categoric grammaticale 

En spfeifiant une cat6gorie grammaticale, seules les occurrences de cette cat6gorie sont rete- 
nues. 

Paramktre: la prMsitm au niveau lexical 

En spteifiant la precision au niveau lexical, seules les occurrences possMant cette valeur sont 
retenues. 

Paramktre: la pricisitm au niveau contextuel 
En spteifiant la precision au niveau contextuel, seules les occurrences poss6dant cette valeur 
sont retenues. 

Paramktre: les mots exclus 
L'utilisateur pout faire inclure ("O") ou exclure CN*) les occurrences des mots qui appartiennent 
ft la liste des mots exclus. Ce choix doit s'ajouter & Tun dw pr6c6dents. 

Paramktre: ...mots pricidents ou suivants 
L*utilisateur pent imposer une contraintc de cooccurrence contextuelle sur la selection, en spdci- 
fiant le ou les mots formes qui doivent se trouver dans le voisinage. On peut d6f inir un contexte 
comprenant de 1 ft 3 mots devant et de 1 ft 3 mots apris les occurrences en cause. 



OPTION 03: Impression du corpus (liste du texte) 
Description 

a) Cette fonction fait I'impression du texte avec r6f6rence ft la ligne. 

b) L'impression des pages se fait avec en-tfite comprenant le titre, la date, le nom de la 
banque de donn^es, la num^rotation de la page. 

c) On peut imprimer une partie du texte en sp^ifiant le debut et la fin de la section d^sir^e. 

Fonctionnement 

m Activer Timprimante. 

■ Dans r*cran Rl, entrer le nom de la banque de donn6es suivi de RETOUR. 

■ Choisir Toption 03; T^cran R31 s'affiche comme suit: 

ERIC 47 
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*** WnniMi du t«xt« *** *cran RSI 

Quel at lintfirraUc d» rtfiArraces h inqyrinMr? 

d« (RETOUR) ft (RETOUR) 

(Rx^tion dfl I'opAntlon: PgDn) 

■ Inscrire rintervalle r^f^rences k iinprimer si une parJe seulement du texte est vis^e; 
sinou faire deux RETOUR et tout le texte est impriro^. 

■ Le texte s'afflche & T^cran en mtme temps qu'il s'imprime. 

■ Aprto rop^ration, on retourne k T^cran Rl. 

OPTION 04: Impression du dictionnaire (liste) 
Descriptio:i 

a) Cette fonction fait Timpression du dictionnaire et rend jompte du type, des lemmes et des 
codes grammaticaux de chaque mot-forme. Le code du type indique si Tentr^ dans la liste 
correspond i un lemme pour lequel il n'y a pas de forme textuelle reconnue (type 1 ), ^ un 
mot-forme de type unique (type 2), ou t un mot-forme & plusieurs lemmes possibles (type 
3). 

b) L'impression des pages se fait avec en-t€te comprenant: le titre, la date, le nom de la 
banque de donn6es et la num^rotation de la page. 

Fonctionnement 

■ Activer rimprimante. 

■ Dans r^cran Rl, entrer le nom du dictionnaire suivi de RETOUR. 

■ Ensuite choisir Toption 04. 

■ La presentation de la liste du dictionnaire s'affiche a T^cran pendant Timpression. 

■ Aprds Top^ration, on retourne k I'^cran Rl. 

OPTION 05; Transfert de la banque sur bande magn6tique 
Cette fonction n'^tait pas encore disponible & la date de publication. 
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OPTION 06: Transfert de la banque sur disquette(s) 
Description 

a) Cette fonction permet de copier sur disquette tout le contenu d'une banque de donnies 

b) La banque peut occuper plus d'une disquette. uonnees. 

c) Cette fonction effectue le transfert uniquement sur I'unite A. 

Fonctionnement 

■ Insurer dans I'unita A la disquette r^ceptrice. 

■ ^J f^"^ ? V ^® ""^"^ **** ^^^^'^^ donndes. Faire un RETOUR et la fonction 
va s acuver. Si le contenu d'une banque de donn^es est sup^rieur h la capacity d'une dis- 
U^r le "^to*^ »°d,quera, le moment venu, d'introduire une autre disquette pour comp- 
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